Biến thể di truyền là gì? Các nghiên cứu khoa học liên quan

Biến thể di truyền là sự khác biệt trong trình tự DNA giữa các cá thể cùng loài, có thể ảnh hưởng đến kiểu hình, chức năng sinh học hoặc nguy cơ bệnh tật. Chúng tồn tại ở nhiều dạng như SNP, indel, CNV hay SV và đóng vai trò quan trọng trong tiến hóa, di truyền bệnh và y học cá thể hóa.

Định nghĩa biến thể di truyền

Biến thể di truyền (genetic variation) là những khác biệt trong trình tự DNA giữa các cá thể trong cùng một loài, xảy ra tự nhiên qua quá trình sao chép, đột biến hoặc tái tổ hợp. Đây là yếu tố trung tâm tạo nên sự đa dạng sinh học và là cơ sở di truyền của sự tiến hóa và chọn lọc tự nhiên.

Biến thể có thể xuất hiện tại bất kỳ vị trí nào trong hệ gen — trong vùng mã hóa (exon), vùng điều hòa (promoter, enhancer), vùng không mã hóa (intron, UTR) hoặc vùng giữa các gen (intergenic). Chúng có thể ảnh hưởng đến chức năng gen hoặc không có tác động sinh học đáng kể.

Một số biến thể là di truyền (germline) và được truyền từ thế hệ này sang thế hệ khác, trong khi những biến thể khác chỉ xuất hiện trong tế bào soma (somatic) và không di truyền, thường gặp trong ung thư hoặc bệnh lý tích lũy.

Các loại biến thể di truyền

Các biến thể di truyền được phân loại dựa trên bản chất cấu trúc và độ dài đoạn DNA bị ảnh hưởng. Trong các nghiên cứu di truyền hiện đại, năm nhóm chính bao gồm:

  • Biến thể đơn nucleotide (SNP): Thay đổi một base đơn duy nhất — ví dụ A thành G
  • Indel: Chèn (insertion) hoặc xóa (deletion) từ 1 đến 50 base
  • Copy Number Variation (CNV): Tăng hoặc giảm số bản sao của đoạn DNA dài hơn 50 bp
  • Biến thể cấu trúc (SV): Đảo đoạn, chuyển đoạn, lặp đoạn hoặc mất đoạn lớn
  • Biến thể số lượng toàn nhiễm sắc thể: Thường gây bệnh di truyền nặng (ví dụ: tam bội nhiễm sắc thể 21 gây Down)

Dưới đây là bảng so sánh đặc điểm cơ bản của một số loại biến thể:

Loại biến thể Kích thước Tần suất trong hệ gen người Tác động sinh học
SNP 1 bp ~1/1000 base Có thể ảnh hưởng đến mã hóa hoặc điều hòa
Indel 1–50 bp Ít phổ biến hơn SNP Có thể gây lệch khung đọc (frameshift)
CNV >50 bp Phân bố không đồng đều Tăng/giảm lượng protein, ảnh hưởng điều hòa gen

Biến thể di truyền và biểu hiện kiểu hình

Biến thể di truyền có thể ảnh hưởng trực tiếp đến kiểu hình cá thể — bao gồm đặc điểm hình thái, sinh lý và nguy cơ bệnh tật. Ví dụ, SNP trong vùng mã hóa gen quy định sắc tố da có thể dẫn đến sự khác biệt màu da giữa các quần thể.

Biến thể ở vùng exon có thể tạo ra đột biến sai nghĩa (missense), vô nghĩa (nonsense) hoặc không thay đổi axit amin (silent). Đột biến sai nghĩa có thể làm biến đổi chức năng hoặc cấu trúc của protein. Đột biến vô nghĩa có thể tạo codon kết thúc sớm dẫn đến protein không hoàn chỉnh.

Biến thể ngoài vùng mã hóa — ví dụ ở promoter hoặc enhancer — có thể thay đổi cường độ biểu hiện gen thông qua tác động đến yếu tố phiên mã hoặc cấu trúc nhiễm sắc thể. Những biến thể này dù không thay đổi cấu trúc protein nhưng lại ảnh hưởng đến mức độ biểu hiện.

Biến thể di truyền và bệnh lý

Nhiều rối loạn di truyền đơn gen là kết quả của các biến thể có tác động chức năng mạnh. Ví dụ: Đột biến trong gen HBB gây bệnh thiếu máu hồng cầu hình liềm do thay đổi cấu trúc hemoglobin.

Đối với các bệnh phức tạp như tiểu đường, bệnh tim mạch hoặc rối loạn thần kinh, mỗi biến thể chỉ đóng góp một phần nhỏ vào nguy cơ chung. Do đó, cần đến phân tích đa biến và mô hình hóa nguy cơ di truyền tổng hợp (polygenic risk score).

Các cơ sở dữ liệu như ClinVar lưu trữ hàng trăm nghìn biến thể có liên quan bệnh lý, được xác định qua các nghiên cứu lâm sàng và mô hình hóa chức năng.

Đo lường và phát hiện biến thể

Phát hiện biến thể di truyền dựa trên dữ liệu giải trình tự DNA là bước then chốt trong nghiên cứu gen học và y học cá thể hóa. Các công nghệ phổ biến hiện nay bao gồm:

  • Giải trình tự thế hệ mới (NGS): Cho phép thu nhận hàng triệu đoạn đọc ngắn, áp dụng trong WES (Whole Exome Sequencing) và WGS (Whole Genome Sequencing)
  • SNP microarray: Phát hiện biến thể phổ biến (SNP) với chi phí thấp, độ phủ thấp hơn WGS
  • Long-read sequencing: Sử dụng công nghệ như PacBio, Oxford Nanopore để phát hiện biến thể cấu trúc (SV, CNV)

Sau giải trình tự, các thuật toán gọi biến thể (variant calling) như GATK HaplotypeCaller hoặc DeepVariant được sử dụng để xác định vị trí, kiểu và đặc tính của biến thể. Các biến thể sau đó được chú thích chức năng bằng công cụ như ANNOVAR hoặc VEP.

Hướng dẫn thực hành: Broad Institute - GATK Best Practices

Đa hình di truyền và nghiên cứu GWAS

Biến thể di truyền được phân loại thành phổ biến (MAF > 1%) và hiếm (MAF < 1%). Những biến thể phổ biến (polymorphism) thường không gây bệnh trực tiếp nhưng liên quan đến nguy cơ bệnh qua nghiên cứu GWAS (Genome-Wide Association Studies).

GWAS khảo sát hàng triệu SNP trên toàn hệ gen ở hàng ngàn người để xác định các vị trí liên quan thống kê đến bệnh hoặc tính trạng. Phân tích này sử dụng hồi quy logistic hoặc mô hình tuyến tính với kiểm định giả thuyết:

H0:Khoˆng coˊ moˆˊi lieˆn hệ giữa SNP vaˋ bệnhH_0: \text{Không có mối liên hệ giữa SNP và bệnh}

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

Các phát hiện GWAS đóng vai trò quan trọng trong xây dựng chỉ số nguy cơ đa biến (polygenic risk score) cho các bệnh như tiểu đường type 2, Alzheimer, hoặc bệnh tim mạch.

Ảnh hưởng của biến thể lên phiên mã và dịch mã

Biến thể có thể ảnh hưởng đến mọi cấp độ của biểu hiện gen: phiên mã, xử lý RNA, dịch mã và phân hủy mRNA. Một số ví dụ:

  • Promoter: SNP thay đổi điểm gắn yếu tố phiên mã (TFBS), làm tăng hoặc giảm phiên mã
  • Splice site: Đột biến tại vị trí cắt-nối gây bỏ exon hoặc giữ intron
  • UTR: Biến thể ở vùng 5' hoặc 3' UTR ảnh hưởng đến sự ổn định và hiệu quả dịch mã
  • Codon: Đột biến sai nghĩa, vô nghĩa hoặc lệch khung đọc gây thay đổi protein

Các biến thể gây mất chức năng (loss-of-function) thường liên quan đến bệnh di truyền trầm trọng. WES được ưu tiên sử dụng để phát hiện đột biến ở vùng exon ảnh hưởng trực tiếp đến mã hóa protein.

Tương tác biến thể – môi trường

Không phải biến thể nào cũng gây tác động giống nhau ở mọi cá thể. Tác động của biến thể phụ thuộc vào môi trường sống, lối sống, chế độ ăn, stress, nhiễm trùng hoặc các yếu tố khác. Đây là trọng tâm của nghiên cứu tương tác gene – môi trường (GxE).

Ví dụ:

  • Người mang allele nguy cơ của gen APOE ε4 có nguy cơ Alzheimer cao hơn nếu hút thuốc, ăn nhiều chất béo bão hòa
  • Biến thể trong gen FTO liên quan đến béo phì chỉ biểu hiện khi năng lượng đầu vào cao hơn mức tiêu hao

Mô hình hóa tương tác này đòi hỏi các bộ dữ liệu lớn và phân tích thống kê mạnh, thường sử dụng hồi quy đa biến hoặc học máy.

Ứng dụng trong y học cá thể hóa

Các thông tin về biến thể di truyền đang thúc đẩy sự phát triển của y học cá thể hóa (precision medicine), trong đó điều trị và phòng bệnh được thiết kế theo hồ sơ gen cá nhân.

Các ứng dụng chính:

  • Pharmacogenomics: Lựa chọn và liều dùng thuốc theo gen (ví dụ: gen TPMT trong điều trị ung thư máu)
  • Dự đoán nguy cơ: Dựa vào chỉ số nguy cơ di truyền (PRS) từ hàng trăm biến thể
  • Chẩn đoán trước sinh: Sàng lọc và phân tích biến thể ở phôi (PGT), hoặc thai nhi (NIPT)

Hệ cơ sở dữ liệu PharmGKB cung cấp thông tin cập nhật về các biến thể ảnh hưởng đến dược động học và dược lực học của thuốc.

Tài liệu tham khảo

  1. Strachan, T., & Read, A. (2018). Human Molecular Genetics (5th ed.). Garland Science.
  2. Visscher, P. M., et al. (2017). 10 years of GWAS discovery: Biology, function, and translation. Nature Reviews Genetics, 18(2), 113–130.
  3. Shendure, J., et al. (2017). DNA sequencing at 40: Past, present and future. Nature, 550(7676), 345–353.
  4. Manolio, T. A., et al. (2009). Finding the missing heritability of complex diseases. Nature, 461(7265), 747–753.
  5. National Human Genome Research Institute. Genetic Variation Glossary.
  6. GATK Best Practices. https://gatk.broadinstitute.org.
  7. PharmGKB. https://www.pharmgkb.org/.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề biến thể di truyền:

Một biến thể di truyền phổ biến trong vùng không phiên mã 3' của gen prothrombin liên quan đến mức prothrombin huyết thanh cao và tăng nguy cơ hình thành huyết khối tĩnh mạch Dịch bởi AI
Blood - Tập 88 Số 10 - Trang 3698-3703 - 1996
Chúng tôi đã khảo sát gen prothrombin như một gen ứng cử viên cho huyết khối tĩnh mạch ở những bệnh nhân được chọn có tiền sử gia đình về thrombophilia tĩnh mạch đã được ghi nhận. Tất cả các exon và vùng 5′-UT và 3′-UT của gen prothrombin đã được phân tích bằng phương pháp phản ứng chuỗi polymerase và giải trình tự trực tiếp ở 28 bệnh nhân. Ngoại trừ các vị trí đa hình đã biết, không phát ...... hiện toàn bộ
#gen prothrombin #huyết khối tĩnh mạch #allele A 20210 #mức prothrombin huyết thanh #đa hình gen
Gen ứng cử viên cho vị trí bệnh Alzheimer's gia đình trên nhiễm sắc thể 1 Dịch bởi AI
American Association for the Advancement of Science (AAAS) - Tập 269 Số 5226 - Trang 973-977 - 1995
Một gen ứng cử viên cho vị trí bệnh Alzheimer (AD) trên nhiễm sắc thể 1 đã được xác định ( STM2 ). Chuỗi axit amin dự đoán cho STM2 có tính tương đồng với chuỗi của gen AD trên nhiễm sắc thể 14 mới được clon (S182). Một đột biến điểm trong STM2... hiện toàn bộ
#bệnh Alzheimer #gen ứng cử viên #đột biến N141I #nhiễm sắc thể 1 #di truyền học
Ước lượng gánh nặng kiểm tra nhiều cho các nghiên cứu liên kết trên toàn bộ gen của gần như tất cả các biến thể phổ biến Dịch bởi AI
Genetic Epidemiology - Tập 32 Số 4 - Trang 381-385 - 2008
Tóm tắtCác nghiên cứu liên kết toàn bộ gen là một chiến lược thú vị trong di truyền học, gần đây đã trở nên khả thi và thu được nhiều gene mới liên quan đến nhiều kiểu hình. Việc xác định tầm quan trọng của các kết quả trong bối cảnh kiểm tra một tập hợp nhiều giả thuyết toàn bộ gen, hầu hết trong số đó sản sinh ra các tín hiệu liên kết phát tín hiệu ồn ào, phân ph...... hiện toàn bộ
#Nghiên cứu liên kết toàn cầu #gánh nặng kiểm tra #các biến thể phổ biến #phân tích số liệu #di truyền học #thí nghiệm thống kê.
Các đột biến DNA ty thể phức hợp I và III liên quan đến bệnh thần kinh thị giác di truyền Leber Dịch bởi AI
Genetics - Tập 130 Số 1 - Trang 163-173 - 1992
Bốn đột biến sai ngữ mới đã được xác định thông qua phân tích hạn chế và giải trình tự DNA ty thể (mtDNA) từ các bệnh nhân mắc bệnh thần kinh thị giác di truyền Leber (LHON) mà không có đột biến 11778 đã được xác định trước đó. Mỗi đột biến đã làm thay đổi một acid amin bảo tồn và tương quan với kiểu hình LHON trong các phân tích quần thể và phát sinh loài. Đột biến cặp nucleotide (np) 13708 (G th...... hiện toàn bộ
Biến thể số lượng bản sao có mối tương quan cao với biểu hiện gen khác biệt: một nghiên cứu toàn diện về ung thư Dịch bởi AI
Springer Science and Business Media LLC - Tập 20 Số 1 - 2019
Tóm tắt Đặt vấn đề Ung thư là một bệnh lý đa dạng với nhiều biến thể di truyền. Các dòng chứng cứ đã chỉ ra rằng sự biến đổi số lượng bản sao (CNVs) của một số gen tham gia vào việc phát triển và tiến triển của nhiều loại ung thư thông qua sự thay đổi mức độ biểu hiện gen của từng loạ...... hiện toàn bộ
#Biến thể số lượng bản sao #biểu hiện gen #ung thư #sinh tin học #di truyền học.
Các biến thể di truyền trong IRF6 và nguy cơ mắc dị tật môi: phân tích theo dấu hiệu đơn lẻ và dựa trên haplotype trong một nghiên cứu trường hợp - đối chứng dựa trên quần thể ở Na Uy Dịch bởi AI
Genetic Epidemiology - Tập 32 Số 5 - Trang 413-424 - 2008
Tóm tắtCác đột biến trong gen mã hóa yếu tố điều hòa interferon 6 (IRF6) là nguyên nhân chính gây ra một dạng phổ biến của dị tật môi có hội chứng được biết đến với tên gọi hội chứng Van der Woude. Các hố môi và sự thiếu hụt răng là hai đặc điểm bổ sung duy nhất phân biệt hội chứng này với các dị tật môi đơn lẻ. Vì vậy, hội chứng Van der ...... hiện toàn bộ
Các biến thể mã hóa của mẹ trong thụ thể bổ sung 1 và sinh non tự phát vô căn Dịch bởi AI
Springer Science and Business Media LLC - Tập 132 - Trang 935-942 - 2013
Sinh non (PTB) là một mối quan tâm lớn về sức khỏe cộng đồng toàn cầu. Tuy nhiên, có rất ít thông tin về sinh lý bệnh của sinh non vô căn tự phát. Chúng tôi đã kiểm tra giả thuyết rằng các biến thể hiếm trong các gia đình sẽ nhắm đến các gen và con đường cụ thể góp phần vào nguy cơ sinh non trong quần thể chung. Phân tích bộ gen toàn bộ được thực hiện trên 10 bà mẹ sinh non từ các gia đình bị ảnh ...... hiện toàn bộ
#sinh non #biến thể di truyền #bổ sung #sinh lý bệnh #bà mẹ #mã hóa
Các bệnh do đột biến điểm trong DNA ty thể Dịch bởi AI
Journal of Inherited Metabolic Disease - - 1992
Tóm tắtNhiều đột biến DNA ty thể (mtDNA) đã được xác định gây ra các bệnh thoái hóa thần kinh cơ di truyền, khởi phát muộn. Những đột biến này bao gồm các đột biến thay thế axit amin trong hầu hết các gen polypeptide của mtDNA cũng như các thay thế bazơ trong một số gen tRNA. Các đột biến thay thế axit amin trong các gen vận chuyển điện tử ty thể gây ra bệnh viêm t...... hiện toàn bộ
#đột biến DNA ty thể #bệnh thoái hóa thần kinh cơ #bệnh viêm thần kinh thị giác di truyền Leber #bệnh động kinh myoclonic #hội chứng bệnh não ty thể
Biến thể di truyền của hệ thống renin-angiotensin-aldosterone: vai trò hay khoảng trống trong việc xảy ra và dự đoán lâu dài cơn nhồi máu cơ tim cấp ở độ tuổi trẻ Dịch bởi AI
Springer Science and Business Media LLC - - 2007
Tóm tắt Giới thiệu Hệ thống renin-angiotensin-aldosterone (RAAS) có vai trò trong việc duy trì ổn định tim mạch, như đã chỉ ra bởi các nghiên cứu trước đây báo cáo mối liên hệ tích cực giữa các kiểu gen RAAS cụ thể và nguy cơ gia tăng nhồi máu cơ tim. Tuy nhiên, vai trò tiên đoán trong một thời g...... hiện toàn bộ
#RAAS #nhồi máu cơ tim cấp #biến thể di truyền #tiên lượng #bệnh nhân trẻ
Mối liên hệ giữa các biến thể di truyền ESR1, ESR2, HER2, UGT1A4 và UGT2B7 với ung thư vú tại Jordan: một nghiên cứu đối chứng Dịch bởi AI
BMC Cancer - Tập 19 Số 1 - 2019
Tóm tắt Đặt vấn đề Nguy cơ, sự phát triển và điều trị ung thư vú bị ảnh hưởng bởi biến thể di truyền ở một số gen nhất định, cụ thể là những gen liên quan tới sự tăng sinh tế bào, ức chế khối u và chuyển hóa thuốc. Do đó, sự liên quan của biến thể di truyền được đề cập trên đây tới ung thư phụ thuộc vào nhóm dân tộc cụ thể, điều n...... hiện toàn bộ
Tổng số: 193   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10